特征值和特征向量

Eigenvalues and Eigenvectors

一、基本定义和几何意义

Ax=λx

λ 为特征值 x 为特征向量

直观上的理解:当矩阵作用于向量时,大多数向量会改变方向,但是有某些向量不会改变方向,而只是在同一方向上伸缩。其中:不改变方向的向量为特征向量,伸缩的倍数为特征值

二、计算特征值和特征向量

特征方程

(AλE)x=0

特征多项式

f(λ)=det(AλE)=|a11λa12a1na21a22λa2nan1an2annλ|=0

三、迹和行列式

可以通过矩阵本身,快速得到特征值的和与积

λ1+λ2++λn=a11+a22++ann=tr(A) λ1λ2λn=|A|

实矩阵的复数特征值

如果矩阵有复数的特征值,则特征值一定共轭。
设特征值为 λ=a+ib,λ=aib

Ax=λxAx=λx

实际应用

最重要的应用: 矩阵对角化
稳定性分析:在控制理论中,系统稳定性的分析依赖于系统矩阵的特征值的实部。
数据降维主成分分析(PCA)中,特征向量帮助确定数据的主要变化方向。


AI 结构化补充(2026-05-02)

Eigenvalues and Eigenvectors

一、基本定义和几何意义

Ax=λx

λ 为特征值 x 为特征向量

严格说,A 必须是方阵,且 x0;零向量虽然满足许多齐次等式,但不作为特征向量。

直观上的理解:当矩阵作用于向量时,大多数向量会改变方向,但是有某些向量不会改变方向,而只是在同一方向上伸缩。其中:不改变方向的向量为特征向量,伸缩的倍数为特征值

二、计算特征值和特征向量

特征方程

(AλE)x=0

特征多项式

f(λ)=det(AλE)=|a11λa12a1na21a22λa2nan1an2annλ|=0

三、迹和行列式

可以通过矩阵本身,快速得到特征值的和与积

λ1+λ2++λn=a11+a22++ann=tr(A) λ1λ2λn=|A|

实矩阵的复数特征值

如果矩阵有复数的特征值,则特征值一定共轭。
设特征值为 λ=a+ib,λ=aib

Ax=λxAx=λx

实际应用

最重要的应用: 矩阵对角化
稳定性分析:在控制理论中,系统稳定性的分析依赖于系统矩阵的特征值的实部。
数据降维主成分分析(PCA)中,特征向量帮助确定数据的主要变化方向。

计算路线与快速校验

特征值问题的几何起点是

Ax=λx,x0.

特征值 λ 描述该方向被拉伸、压缩、反向或压到零;当 λ=0 时,对应特征向量就在 A 的零空间中。计算时先解

det(AλI)=0

得到特征值,再把每个根代回 (AλI)x=0 求对应特征向量。迹与行列式提供快速校验:特征值之和等于 trA,特征值之积等于 detA

不变方向的运算规则

Ax=λx,

则同一个特征向量方向在若干常见矩阵运算下保持不变:

A2x=λ2x,A1x=λ1x,(A+cI)x=(λ+c)x.

其中 A1 这一条要求 A 可逆,也等价于这个特征值不为 0。更一般地,矩阵的高次幂不会混合已经分解到特征向量方向上的分量;每个方向只被自己的特征值反复缩放。因此特征值问题把复杂的向量演化拆成若干一维伸缩。

Markov 矩阵中的稳定方向

A=(0.80.30.20.7).

它的特征方程为

det(AλI)=λ232λ+12=(λ1)(λ12),

所以特征值为 112。对应特征向量可取

x1=(0.60.4),x2=(11).

x1 是稳定方向,因为 Ax1=x1x2 是衰减方向,因为 Ax2=12x2。第一列可以写成

(0.80.2)=x1+0.2x2,

于是

A99(0.80.2)=x1+0.2(12)99x2.

这解释了为什么高次幂的列趋近于同一个稳定向量:

A100(0.60000.60000.40000.4000).

投影、反射与零特征值

投影矩阵的特征值只可能是 10。例如

P=(0.50.50.50.5)

满足

P(11)=(11),P(11)=0.

因此 λ=1 的特征向量填满投影保留的列空间,λ=0 的特征向量填满被压到零的零空间。反射矩阵

R=(0110)=2PI

有相同的两个特征向量,但特征值变为 11:方向 (1,1)T 不变,方向 (1,1)T 被反向。

零特征值没有特殊禁忌。它的含义只是存在非零向量 x 使 Ax=0,即 x 在零空间中;因此方阵奇异当且仅当 0 是一个特征值。

奇异矩阵例子

A=(1224),

det(AλI)=(1λ)(4λ)4=λ25λ=λ(λ5).

所以特征值为 05。对应特征向量可取

λ=0: x=(21),λ=5: x=(12).

这里 λ=0 来自矩阵本身奇异,λ=5 来自平移后的矩阵 A5I 奇异。任一特征向量的非零倍数仍是同一特征值的特征向量。

AB 与 A+B 的常见误区

一般不能把 AB 的特征值直接相乘得到 AB 的特征值,也不能直接相加得到 A+B 的特征值。问题出在特征向量不一定共享。

x 同时满足

Ax=λx,Bx=βx,

ABx=A(βx)=βAx=βλx,

并且

(A+B)x=(λ+β)x.

但这只对同一个公共特征向量成立。反例是

A=(0100),B=(0010).

AB 的特征值全为 0,可是

AB=(1000),A+B=(0110)

分别出现特征值 1,以及 1,1。如果 AB 有一组共同的 n 个线性无关特征向量,则可以在这些方向上逐一相乘或相加特征值,这正是共同特征向量条件的意义。

基与对角化的边界

特征向量最有用的情形,是它们组成一组基。这样任意向量都可以分解到特征方向上,矩阵的幂、逆和平移都按一维规则处理。若一个 2×2 矩阵只有一条特征向量直线,即使代数上有重特征值,也不能得到完整特征向量基,因而不能直接对角化。单位矩阵是相反的极端:它的特征值全为 1,但每个非零向量都是特征向量。